s

Accueil

www →

l

Introduction :

Début février 2020, je pose un pied sur le sol de Plzeň, ma destination Erasmus en République tchèque pour les cinq prochains mois. Je ne comprends pas un mot de ce qui m’entoure. Je ne prononce pas un seul mot tchèque correctement. L’alphabet de cette langue slave me semble habillé tout comme l’alphabet latin, comme un jumeau indiscernable, mais accessoirisé de petits signes diacritiques. Ici, les lettres sont de faux amis, je les approche, elles se dérobent sous mes yeux et ma langue française. Je songe alors aux futurs cours de tchèque que j’ai choisi de suivre dans ma faculté d’adoption, mais comme le dit si bien Wikipédia1, « en raison de sa complexité, le tchèque est considéré comme difficile à apprendre ». Il faut savoir décliner chaque mot en fonction de son rôle dans la phrase. Et chaque mot possède son propre genre, féminin, masculin, neutre, animé, inanimé. Après de nombreuses années passées sous l’influence communiste, ici la langue véhiculaire pour communiquer avec les non natifs du pays n’est pas l’anglais, mais le russe. Une solution s’offre à moi face à cette impasse, celle de la traduction automatique, et particulièrement celle de Google traduction sur mon téléphone portable. Escortée de ce nouvel outil, je scanne désormais mon quotidien à Plzeň et y fait de belles découvertes, l’interaction entre la base de données linguistiques de cette application et mon environnement met au jour des espaces de frottement, de glissement vers des jeux de mots, ou génère des poésies dignes d’être partagées.

« Traduire » est un terme riche de sens, riche d’interprétations. En chinois, cela se traduit par le terme " 翻译 ", « retourner un tissu ». La traduction est un geste en chinois, c’est un acte voulu, un mouvement, délicat, sans déchirure. À l’inverse du français ou de l’anglais, dont le terme est relatif au fait d’opérer une translation, de transporter, d’un lieu vers un autre. Dans L’aventure sémiologique2, Roland Barthes compare le signifiant et le signifié au recto et au verso d’une feuille. Découper cette feuille formerait un signe, et cette découpe générerait deux éléments de manière coordonnée : le recto et le verso, coupés en même temps. La traduction dans sa conception chinoise en tant que tissu y trouverait alors tout son sens. Serait-ce alors l’acte de retourner ce tissu du langage que l’on connaît, dont on a assimilé les motifs et la structure du fil, les tâches et les usures, afin de faire apparaître le côté inconnu ? Serait-ce alors comme rechercher de nouveaux motifs, de nouveaux mots, de nouveaux signifiants qui appartiendraient à un autre langage, pour se procurer toute une collection de tissus divers, à échanger ou tout simplement à conserver pour soi ? Cette collection, je l’ai amorcée avec les outils de traduction à ma disposition durant cette période d’échange à l’étranger. Et je la poursuis aujourd’hui à ma manière, tentant d’en trouver les limites pour les contourner, les ouvertures par leurs failles et leurs atouts. Ma pratique graphique m’amène aujourd’hui à explorer, au fil de ces pages, le potentiel et les limites de ces nouveaux outils de traduction automatique, d’identifier vers quels lieux ils nous entrainent.

Les « outils de traduction automatique » sont tous ces logiciels permettant de passer d’une langue source vers une langue cible. Les plus connus étant Google traduction, DeepL, Reverso, mais également Systran, BabelFish, Microsoft translator, ou les dictionnaires bilingues en ligne tels WordReference, Linguee, Lexilogos et bien d’autres. L’introduction d’outils de traduction automatique dans notre quotidien a certainement modifié nos pratiques, en particulier de voyage. Auparavant, à moins de connaître la langue locale, voyager supposait une connaissance minimale d’une deuxième langue dite « universelle » telle l’anglais, ou bien imposait une communication non verbale. Il était nécessaire de prendre avec soi quelques repères linguistiques, tels des dictionnaires bilingues, des listes de phrases, de pictogrammes, d’images, ayant pour visée de nous sortir de situations d’urgence. Cette organisation imposée par la langue induisait alors que le voyage serait accessible à une certaine catégorie sociale, une certaine élite, disposant de moyens financiers, d’un bagage culturel, de temps de préparation. Aujourd’hui, le schéma a quelque peu changé : voyager à l’étranger n'est plus aussi coûteux, grâce, ou à cause, de l’émergence de vols low-cost, de billets de train et de bus à prix réduit, de nouvelles habitudes telles que le covoiturage. L’essor des transports nous amène toujours plus loin, toujours plus vite. Et parler une langue « universelle » n’est plus une première nécessité pour voyager car ces évolutions technologiques nous dotent pour la plupart de smartphones, de connexions internet illimitées, nous donnant accès à des milliers d’applications et notamment à ces outils de traduction automatique qui tendent à faciliter une communication instantanée avec les locaux.

Ainsi, quelles considérations sur le langage verbal et expérimentations sensibles soulèvent les outils de traduction automatique dans nos usages quotidiens ? Des considérations, sous le sens d’un examen attentif, d’observations accrues sur ces outils, sous un œil novice en termes d’informatique, de sociologie ou de linguistique, plus averti en termes de design graphique, mais également des considérations sous le sens de l’estime que l’on peut leur porter, des égards que l’on peut leur accorder. De là, découlent mes premières hypothèses que je souhaiterais affirmer ou infirmer au fil de ces pages. L’accessibilité de ces outils de traduction automatique à un public de plus en plus étendu ferait émerger de nouvelles perspectives, en termes de communication certes, mais la manipulation de ces outils nous rendrait plus attentifs à la structure et aux limites de notre propre langue. Ces outils de traduction automatique qui tentent de mimer le métier antique de l’interprétation simultanée, sur des machines, afficheraient sans filtre ces failles propres au traitement du langage, habituellement dissimulées ou réparées par le professionnel humain. Ces interstices ouverts et librement affichés par les machines pourraient appeler à une nouvelle création, à un contournement graphique, littéraire, poétique. Le linguiste Antoine Berman3 distingue la notion de « texte » et de « message ». Pour lui, seule la littérature produit des textes, tandis que la communication fournit des messages. Mais la traduction automatique ne prend actuellement que peu en compte la nature de ce qui est à traduire, et peu son contexte. Ainsi, en injectant du tout-venant dans ces outils de traduction automatique, transformons-nous des messages à visée communicationnelle en textes littéraires non intentionnels ? Ces nouveaux outils permettraient une opération de transcodage automatique quelle qu’en soit l’origine verbale.

Je considère alors dans ces pages des questions d’ordre structurel et graphique à propos de ces outils de traduction automatique, et sur leur potentiel créatif selon qu’ils traitent ou génèrent un texte, un son ou une image. Mon processus de recherche passe prioritairement par mon expérience de ces outils de traduction automatique au cours de ces derniers mois, approche alors quelque peu empirique, mais qui se veut soutenue par des lectures théoriques. J’ai privilégié des retours de la part de traducteurs-interprètes et d’un spécialiste du Traitement Automatique du Langage Naturel, Thomas Lebarbé, afin d’approfondir ces recherches théoriques.

La traduction de texte, insertion de caractères alphanumériques dans un espace de traduction

Les traducteurs automatiques, description et historique

Dans l’univers atypique de Plzeň, je ne pouvais pas décrypter tout ce qui m’entourait, expérience auditivement feutrée, visuellement nouvelle. J’ai toutefois trouvé une brèche à cette fine enveloppe par le biais des outils de traduction automatique. Ces outils ont alors agi comme mes petits traducteurs simultanés personnels, me suivant à la trace pour me sortir de situations embarrassantes. Je comptais durant mon séjour sur ces outils, mes « tours d’anti-babel » comme le décrivait Rita Raley dans Machine Translation and Global English4.

Il est possible de traduire instantanément des mots par le biais de nos téléphones portables ou ordinateurs grâce à l’avancée dans la recherche de la traduction automatique. Les premiers travaux à ce sujet ont été réalisés à la Georgetown University en 1952 par Léon Dostert. Cette recherche a été amorcée lorsque, à la fin de la Seconde Guerre Mondiale, des budgets militaires ont été investis à grande échelle par les Américains et les Russes qui souhaitaient comprendre ce que disait le camp adverse. Les principes de base de ces premières tentatives de traduction ont alors été lexicographiques, ils reposaient sur une grande quantité de vocabulaire et d’expressions enregistrée dans un ordinateur. Toutefois, le résultat des traductions par cette méthode fût un échec au niveau sémantique. Il fût alors envisagé d’analyser un très grand nombre de phrases, de générer de nombreuses possibilités de traductions, et de sélectionner la meilleure. Toutefois, en 1960, le rapport Bar-Hillel conclue que la traduction automatique ne pourra jamais atteindre la qualité du travail d’un traducteur humain, ce qui a gelé pendant quelques années tout investissement financier dans le domaine. En 1970, les chercheurs changent de méthode. Ils choisissent de traiter en amont les données linguistiques à traduire par un algorithme qui attribue à chaque mot ou expression des données grammaticales. Cette formalisation du langage naturel en un langage mathématique se fait notamment grâce aux travaux de modélisation de Noam Chomsky. Ces modélisations, ou grammaires génératives, permettent de faire des associations entre les langages naturels et les langages informatiques, par des classes d’équivalence reliant les mots à ceux dont le comportement est similaire. La méthode employée est alors dite syntaxique. Cela génère des graphes de phrases équivalentes, et le chemin dont la probabilité est la plus grande est choisi par l’ordinateur en tant que meilleure proposition de traduction. Des ajustements sont faits par la suite, notamment par l’instauration d’un langage pivot, ou interlangue. La traduction français-tchèque par exemple n’est pas une traduction fréquemment demandée par rapport à la liaison français-anglais. Pour pallier certaines failles qui pourraient apparaître, les logiciels de traduction automatique utilisent ce langage pivot, parfois aussi appelé langage pont, comme langage artificiel intermédiaire facilitant la traduction entre deux langues. Pour traduire un texte de la langue A vers la langue B, il est possible de le traduire vers la langue L en tant qu’intermédiaire. Ceci évite de relier directement deux termes étrangers entre eux lorsque la recherche d’une traduction entre ces deux langues est rare. Cela permet aussi de réduire l’explosion combinatoire tout en autorisant la traduction entre ces langues. Par exemple, les combinaisons français-anglais ou anglais-tchèque sont bien fonctionnelles, mais beaucoup moins la combinaison français-tchèque, le langage pivot permet de créer provisoirement la combinaison français-anglais-tchèque. C’est sans doute la raison pour laquelle l’un des rares traducteurs automatiques proposant la liaison français-tchèque est actuellement Google traduction, qui a accès à l’une des plus grandes bases de données lui permettant de créer ces ponts temporaires entre les langues. Ces outils de traduction automatique reposent désormais sur du deep learning ou « apprentissage en profondeur », s’inspirant des dernières avancées en neurosciences afin de traiter des données comme le ferait notre cerveau, par l’assimilation et la mise en relation de neurones. Des progrès spectaculaires ont alors été possibles depuis ces trois dernières années par les efforts des GAFA, de Systran ou de DeepL.

La langue conditionnant notre structure de pensée

Rentrée de mon échange à l’étranger, je porte un regard à mon historique dans Google traduction, dans la partie de l’interface où j’ai inséré moi-même des phrases à traduire. J’y retrouve fréquemment des phrases adressées aux réceptionnistes du dortoir, des phrases utilitaires, des phrases du quotidien. Je montrais mon écran de téléphone où s’affichait le texte en tchèque, j’écrivais, on me parlait. Ces outils de traduction automatique m’ont aidé à déceler quelques différences dans les constructions de phrases, à rectifier des erreurs que j’aurais été tentée de faire en traduisant mot à mot des phrases de ma langue d’origine. Alors, la langue conditionnerait notre structure de pensée. En tchèque, il est difficile de s’exprimer correctement si l’on construit sa phrase tout en parlant, car les déclinaisons s’appliquent sur chacun des mots, déterminant leur fonction dans la phrase : le mot « droite » pour exprimer « je vais à droite » ne se déclinera pas de la même manière que dans la phrase « je reste à droite », car on y désigne un mouvement dans un cas, mais pas dans l’autre. « Droite » se traduira alors par " vpravo " dans un cas, et par " doprava " dans l’autre cas. Cette distinction n’est pas apparente en français, où le même mot est utilisé dans les deux cas sans aucune nécessité de le décliner. Comme il a été démontré dans l’article " How does our language change the way we think "5 écrit par la scientifique cognitive Lera Boroditsky le 6 novembre 2011, le langage que nous parlons a une réelle influence sur notre manière de penser. Le langage peut être défini comme la structure linéaire grâce à laquelle nous communiquons en encodant et décodant une représentation mentale complexe. Un exemple éloigné des frontières européennes est cité dans cet article : celui d’une communauté aborigène du nord de l’Australie. À Pormpuraaw, le peuple des Kuuk Thaayorre n’emploie pas les mots comme « gauche » ou « droite » pour indiquer la localisation d’un objet, mais « ouest », « est », « sud-est »... Il est alors nécessaire pour l’interlocuteur de toujours prêter attention aux points cardinaux, sans quoi il ne pourra pas se faire comprendre correctement des habitants. Cette particularité linguistique permet au peuple Kuuk Thaayorre d’être constamment en capacité de s’orienter, même en lieu inconnu, ce qui n’est pas instinctif pour un locuteur anglais ou français. Pour aller plus loin, l’équipe d’ethnologues qui sont allés à la rencontre de ce peuple aborigène a souhaité voir si leur représentation temporelle était conditionnée par cette orientation spatiale. Il leur a été demandé de placer des images au sol dans l’orientation qu’ils pensaient la plus judicieuse. Ces images étaient chronologiques, elles traduisaient un passage du temps, en proposant plusieurs portraits d’un homme qui vieillissait au fil des images. Un locuteur français ou anglais aurait disposé ces images de gauche à droite, du portrait le plus jeune, au portrait le plus vieux. Un locuteur hébreu les aurait disposées de droite à gauche, en relation avec son système d’écriture. Ce peuple aborigène en a fait autrement : il les a disposées d’est en ouest, en adéquation avec le lever et le coucher du soleil. Ainsi, si l’observateur voit ces images de face, il les lira de droite à gauche. Mais s’il se place de l’autre côté de ces images, il les lira de gauche à droite. Tout dépend de sa position dans l’espace. Cette expérience a permis à l’équipe d’ethnologues de valider l’hypothèse que le langage modèle notre manière de penser.

La détection automatique de la langue

Dans mon historique Google traduction, tous ces petits extraits de phrases à traduire sont en apparence anodins, mais ils représentent un défi dans le domaine de la traduction automatique. Car si l’utilisateur ne sélectionne pas sa langue d’origine dans l’interface des outils de traduction automatique, c’est l’algorithme qui doit détecter la langue dont il s’agit. Pourtant, la certitude de détection de la bonne langue diminue lorsque le texte introduit est très court. Quelques algorithmes se sont alors succédé dans le temps pour remplir cette fonction. Le premier algorithme mis en place comptait la fréquence des mots et établissait des statistiques. Cela permettait de déterminer quels mots caractéristiques d’une langue apparaissaient le plus souvent, et en fonction, de choisir une langue : une majorité de « le » inclinait le choix vers le français, de " the " vers l’anglais, de " der " vers l’allemand. Mais le texte d’entrée devait comporter plus d’une phrase pour que cela fonctionne. Un autre algorithme nommé « N-grammes de caractères », consistait à compter des séquences de caractères, en isolant une séquence de trois caractères par exemple. Cela permettait d’isoler des mots caractéristiques d’une langue comme " the ", " can ", " not ", " him " pour l’anglais, ou « les », « que », « des » pour le français. Le modèle du texte était ensuite comparé à des modèles de langage. Le problème étant que dans certaines langues, ces modèles n’ont jamais été établis. C’est alors le modèle de la langue la plus proche qui était détecté. La méthode la plus récente repose sur un algorithme basé sur la pertinence des mots, ce qui lui permet désormais de fonctionner sur des textes courts. Cette méthode segmente le texte d’entrée et se concentre sur les mots jugés pertinents, pour réduire la confusion entre plusieurs langues. La fonctionnalité « détecter la langue » offerte par ces outils de traduction automatique est alors complexe. Ces algorithmes parviennent mieux à détecter la nature d’une langue sur une grande quantité de texte que sur un terme ou deux, mais la qualité de la traduction ne sera pas égale si elle porte sur un petit texte ou si elle porte sur un grand texte.

La qualité discutable de la traduction

Traducteur automatique et traducteur-interprète

L’univocité n’existe pas réellement à l’intérieur des langues naturelles, il y règne la polysémie, ce qui est difficile à traiter pour un langage informatique logique et mathématique. Lorsqu’un programme informatique traite le langage, il en résulte des erreurs ou des écarts sémantiques. Je note alors un contraste intéressant entre le traducteur professionnel et les traducteurs automatiques qui traduisent jour et nuit tout contenu à caractères alphanumériques, sans distinction, en se basant sur des probabilités par la sélection d’un terme contre un autre. Le traducteur humain fait parfois appel à la Traduction Assistée par Ordinateur (TAO), augmentant certaines fonctionnalités linguistiques avec ses outils de travail informatisés, tandis que la machine réalise une Traduction Automatique (TA), instantanée, selon un rouage logique et mathématique.

J’ai questionné trois traducteurs-interprètes pour connaître les outils dont ils font le plus usage dans leur travail, en particulier à propos de leur pratique d’interprète. Ils ont répondu qu’en amont d’une interprétation simultanée, ils utilisent, comme la majorité d’entre nous, des dictionnaires en ligne comme Linguee, WordReference, Multitran, mais en particulier des ressources de terminologie comme l’IATE (Terminologie Interactive pour l’Europe), les sites des clients qui les ont contactés et quelques pages Wikipédia pour repérer des mots spécifiques au domaine dans lequel ils auront à intervenir, afin de traduire quelques termes en avance. Ils reconnaissent par ailleurs utiliser les outils de traduction automatique tels DeepL, Reverso ou Google traduction, mais uniquement dans un contexte de voyage, dans une langue qu’ils ne maîtrisent pas, car la qualité offerte n’est pas suffisante dans un contexte professionnel. Aussi, ces traducteurs-interprètes ont confirmé que l’essor des outils numériques a fait évoluer graduellement leur métier. Et très récemment, par la montée de plateformes d’interprétation à distance dits de " R.S.I. ", ou Remote Simultaneous Interpretation, telles Kudo, Interprefy ou iBridgePeople. Ces plateformes permettent à ces spécialistes d’interpréter en simultané les paroles de professionnels dans des réunions d’entreprise, des conférences, des études notariales, des visites diplomatiques tout comme dans des évènements sportifs ou culturels. Leur intervention consiste à apporter de la fluidité dans les interactions entre orateurs et auditeurs de langues différentes. Si celle-ci est bien réalisée, l’auditorat prêtera peu attention à la sophistication du système de traductions, derrière lequel se dissimulent les interprètes attentifs. L’écrivain britannique Douglas Adams a décrit ce travail invisible de la part des interprètes comme le « poisson Babel », une créature imaginaire qui, enfoncée dans l’oreille, permettrait de comprendre toutes les langues du monde.

Ce travail d’interprétation simultanée est copié par les outils de traduction automatique, qui souhaiteraient atteindre le niveau de ces « poissons Babel ». Mais le travail des professionnels reste toujours plus fiable, certifié par des années d’études, d’immersion dans la langue, de pratique, ce qui nécessite des connaissances du domaine et une rémunération souvent élevée à la différence de l’accès « gratuit » à ces outils de traduction automatique. La Traduction Automatique est-elle une forme de solution basse qualité de la traduction ? Le choix par défaut, ou par économie, de temps, de moyens, réduisant la qualité du rendu, par des millions d’utilisateurs adeptes des services de traduction en ligne ? Selon trois cercles concentriques qui se rencontrent en leur milieu, proposés par Google images, trois variables principales entrent en jeu dans la commande et la conception d’un design : économique / rapide / de qualité. Le travail de la traduction automatique serait classé sans équivoque en tant que « mauvaise qualité ». Évidemment ce modèle est très critiquable car schématique et réduit à trois variables. Mais en pratique, à l’intersection de rapide et bon marché, nous exigeons de ces algorithmes de traduction automatique d’aller vite et d’être un service gratuit ou pratiquement.

cercles

Good design vs cheap design.

Traiter de grandes quantités de texte

Les outils de traduction automatique ont de nombreux défauts pour traduire des textes de manière qualitative, mais nous en sommes conscients. Nous ne tenterions pas de traduire une grande quantité de texte par ce biais, pour générer un contenu qualitatif. Un livre a, comme contre-exemple, été édité par la maison d’édition L’Indéprimeuse, dirigée par Davina Sammarcelli, titré Jambonlaissé.

Fig.1 Fig.2

L’Indéprimeuse, Jambonlaissé, Paris, 2017.

Ce livre propose une version de Hamlet traduite intégralement par Google traduction. Ainsi, " Hamlet " de William Shakespeare, est devenu mot-à-mot « Jambonlaissé » de « Guillaume Remuepoire ». Le résultat de ce processus a été imprimé et façonné dans un ouvrage de qualité, imitant les volumes de la prestigieuse collection NRF de Gallimard. Mais le contenu déplace en réalité sa portée littéraire, modifiant un classique de la littérature anglaise en un texte proche de l’absurde. Ainsi, dans l’Acte V, Scène 1 de ce classique, ayant lieu dans un cimetière, Google traduction a proposé le mot « fossoyeur », à l’origine " gravedigger ", par le mot « clown ». Ce qui introduit la didascalie « entrez deux clowns avec des pelles, & c. », et l’instauration d’un dialogue entre les personnages « Premier clown » et « Deuxième clown ». Rien n’explique à priori pour quelle raison le mot « fossoyeur » a frayé son chemin vers la traduction de « clown ».Davina Sammarcelli précise que cet ouvrage n’est pas destiné à être lu, mais apprécié en tant qu’objet hybride, incongru, parodique, révélant des trouvailles involontaires par la machine qui laisse échapper entre autres aphorismes et anglicismes.

Pourtant, l’automatisation des traductions pourrait permettre d’aller vite sans que le résultat soit inévitablement médiocre ou poétique. Une option existe déjà à la croisée des trois cercles décrits précédemment, pour obtenir une traduction de qualité, rapide, et peu chère : celle de l’écriture contrainte. Afin de ne pas engager des traducteurs-interprètes professionnels pour traiter des millions de pages générées chaque jour, l’armée a par exemple imposé dans certains de ses services un système de rédaction dans lequel les auteurs de documentation ne doivent pas s’échapper d’un certain schéma de phrase. Dans ce système, une phrase doit contenir un sujet, un verbe, un complément et au maximum un circonstanciel. Le lexique est fermé, de plus, ce système nommé le « français contraint » simplifie les structures de phrases, ce qui permet de traduire de manière automatique tous les documents écrits de cette façon en réduisant les risques de confusion polysémique. Ce français contraint a été repris par la suite dans les notices techniques par Airbus et d’autres compagnies industrielles. Thomas Lebarbé, enseignant-chercheur, informaticien et linguiste, est spécialisé dans le domaine du Traitement Automatique du Langage Naturel (TALN)6. Le TALN étant la branche de l’intelligence artificielle qui vise à traiter le texte, écrit ou oral, notamment en « comprenant » les mots et les rapports subtils qu’ils entretiennent entre eux. Il estime que ce type d’écriture comme le français contraint génère des données pseudo-langagières, proches d’un langage de programmation. En programmation, un mot-clé ne peut pas être utilisé de deux façons différentes, la syntaxe et la sémantique sont figées, un terme équivaut à un concept sans ambiguïté possible. Ainsi, à moins de contraindre le monde entier d’utiliser un vocabulaire limité, à la manière de la Novlangue inventée par George Orwell pour son roman 1984, il n’est actuellement pas envisageable de traduire sans risque d’incertitude les nuances d’une langue par le biais d’un outil de traduction automatique, du moins sans intervention humaine et ses ajustements.

Le deuil du traducteur

Ces réflexions sur la qualité d’une traduction et sa subjectivité amènent alors à ce que Paul Ricœur7, philosophe, appelle l’infinie traduction. " Traduttore, traditore ", « traduire, c’est trahir », selon une expression italienne. La traduction est un geste imparfait, ne pouvant atteindre un idéal, du fait notamment qu’elle date une époque, que les modalités de traduction évoluent. L’Odyssée d’Homère, par exemple, a été traduite à plusieurs reprises. En revanche, les poèmes d’Edgar Poe, traduits par Charles Baudelaire, sont devenues intouchables. Malgré les déséquilibres reconnus par des professionnels de cette traduction et l’obsolescence d’un vocabulaire propre au XIXe siècle, ce sont toujours les traductions de Baudelaire qui aujourd’hui s’imposent plutôt qu’une autre plus contemporaine. Cette difficulté rencontrée dans la traduction de poèmes est résumée par Ivanov et Metner en 19948.

« La traduction est en principe infiniment plus difficile que la création originale en général. Voyez-vous de quoi il s’agit : je dissous l’image poétique cristallisée dans la parole, comme si dans le milieu éthéré qui l’a engendrée, et, l’ayant absorbée, la cristallise à nouveau dans la sphère d’une autre langue, selon les lois et suggestions de cette sphère, en aspirant à obtenir un équivalent idéel et musical de son incarnation précédente, lequel, dans sa nouvelle réincarnation, cesse de ressembler en apparence à sa forme initiale. »

Le traducteur doit alors prendre conscience de ses limites face à ces « plages d’intraduisibilité » et abdiquer pour ne pas sombrer dans le désespoir. Le deuil de l’absolue traduction est un renoncement qui lui sera salutaire. Tout comme pour nous, utilisateurs de ces outils de traduction automatique.

Design des interfaces de traduction

Structure et mise en forme graphique

Au XIXe siècle, les langues vivantes étaient considérées comme mutuellement intraduisibles car un culte était voué à la nation et aux langues nationales, comme l’expliquent Anna Lushenkova Foscolo et Malgorzata Smorag-Goldberg dans leur ouvrage Plurilinguisme et auto-traduction9. Ce n’est qu’au début du XXe siècle que l’époque du modernisme a reconnu la possibilité du transcodage mutuel des langues. Cette capacité de traduire une langue étrangère dans sa propre langue renforce alors le lien entre les territoires. Même si la course à la création de l’outil de traduction automatique qui sera le plus performant, ouverte après les années 50, est désormais une compétition entre de nombreux pays.

Nous connaissons actuellement de nombreux outils de traduction automatique qui proviennent tous d’un pays différent, et qui évoluent à toute vitesse. DeepL par exemple est allemand, Google traduction est américain, Reverso est français. Malgré leurs différentes « nationalités », ces outils de traduction forment comme une famille partageant entre autres une conception graphique similaire. L’une de leurs similarités est la mise en place de deux colonnes, l’une pour y insérer un texte, l’autre pour y découvrir sa traduction. Ce point commun peut s’assimiler en filigrane à une remédiation des éditions imprimées bilingues, dont la mise en page est à l’origine basée sur ce principe de composition gauche-droite. La traduction d’un texte est disposée en miroir du texte d’origine, très souvent une page présente une langue, l’autre page présente la seconde langue. Ces interfaces suivent majoritairement ce principe de séparation en deux espaces. Le peu de variations de structure entre chaque interface de traduction automatique pourrait répondre à la description de « l’esthétique par défaut » dont Etienne Cliquet 10 nous rappelle qu’elle est nommée " vanilla " dans le jargon informatique. Ce terme est lié au parfum des glaces dont celle produite par défaut est à la vanille, mais fait également référence au parfum préféré des américains. Cette allusion à la culture américaine fait écho à une certaine homogénéisation des goûts, présents dans le traitement graphique de ces interfaces de traduction automatique.

Une évolution progressive : interfaces graphiques, fonctionnalités

Il est possible de suivre l’évolution graphique des interfaces de ces traducteurs par le biais de la Wayback Machine, le site internet archivant des captures d’écran de la majorité des sites internet depuis leur création jusqu’à aujourd’hui. Babelfish, lancé en 1997, Reverso en 2000, Google traduction en 2006, Systran translate en 2009, DeepL en 2017, quelle que soit l’année de leur lancement, toutes les plateformes présentent désormais une structure similaire : un texte d’origine, à placer dans une case blanche à gauche et dont la traduction apparaît dans la seconde case blanche, disposée à sa droite.

Mais l’interface graphique de Google traduction a beaucoup évolué depuis son lancement en 2006, notamment par l’intégration d’une entrée et sortie disposées en deux colonnes à partir de 2012. Cette composition dans l’espace de la page permet un aller-retour visuel plus clair entre langue source et langue cible, la traduction apparaissant dans une nouvelle case en-dessous du texte inséré.

Google_translate2008

Google traduction en 2008.

Google_translate2020

Google traduction en 2020.

Systran translate est également un site internet qui a suivi cette évolution dans son interface graphique. L’entreprise Systran, créée en 1968, est l’une des plus anciennes à avoir développé des logiciels de traduction automatique. L’outil de traduction Systran translate est accessible gratuitement, mais certaines versions plus puissantes de cet outil, comme Systran translate API, Systran Pure Neural Server ou EC Systran, qui sont destinées aux professionnels, sont payantes. La fonctionnalité « Traduisez dans votre domaine métier » est une avancée considérable qui permet de traduire des termes spécialisés dans un domaine spécifique. Ce qui éviterait, dans le domaine du design graphique et plus particulièrement de la typographie, par exemple de traduire des termes comme « empattement », les petites extensions qui terminent les extrémités d’un caractère, en " wheelbase ", la distance entre les deux roues d’un véhicule, mais plutôt de proposer le terme " serif ", plus approprié dans ce contexte.

Systran_translate2000

Systran translate en 2000.

Systran_translate2020

Systran translate en 2020.

DeepL, lancé plus récemment en 2017, a tout de suite intégré ce système de doubles colonnes dans son interface graphique. En l’espace de trois ans, de petites modifications graphiques ont été apportées, comme l’ajout d’un arrière-plan grisé, une interversion des couleurs dans le logo, mais les modifications majeures sont cachées dans le cœur de ses algorithmes basés désormais sur du deep learning dont les résultats sont très convaincants. Également, quelques fonctionnalités ont été ajoutées afin de rendre l’expérience utilisateur plus fluide sur cette interface. Les deux rectangles superposés indiquent la possibilité de « copier/coller » la traduction obtenue. Les trois cercles reliés en réseau eux indiquent la fonction « partager », qui permet de récupérer l’URL de cette traduction ou de l’envoyer par mail à un utilisateur Twitter, Facebook. Enfin, la flèche vers le bas permet de sauvegarder en fichier texte le résultat de la traduction. Un fichier .txt sera alors généré et enregistrable sur l’ordinateur, comportant le mot ou la phrase traduit(e), sans indiquer toutefois le terme ou la phrase d’origine, mais avec un lien vers deepl.com.

DeepL_2017

DeepL en 2017.

DeepL_2020

DeepL en 2020.

Si ces interfaces restent sensiblement les mêmes dans le principe d’entrée et sortie d’un texte écrit, les concepteurs de ces interfaces de traduction automatique s’essayent à de nouvelles visualisations graphiques orientées vers la traduction en réalité augmentée. Pour le percevoir, j’ai expérimenté diverses traductions par le biais de Google traduction d’un seul et même titre d’un livre qui traitait de la ville de Plzeň, en tchèque. Le résultat propose, en aparté, une panoplie d’interprétations telles que « Pilsen je sais que je ne sais pas », « Nous savons que nous ne savons pas », « Inconnu de nous », « Je sais que je ne sais pas ». Le titre original étant " známá neznámá ", l’adjectif " známá " décliné du verbe " znát ", « connaître », la traduction correcte devrait ainsi être « Pilsen, connue, inconnue ». Mais la traduction automatique ne décèle pas les nuances dans le verbe « connaître » qui ici ne s’apparentent pas au sens de « savoir » mais plutôt à l’idée de « rencontrer » ou d’« avoir visité ». La proposition du traducteur change à chaque inclinaison du smartphone, les variations de la typographie sont multiples : l’inclinaison de la typographie, sa couleur et sa transparence, s’adaptent telles un caméléon à son support de référence, blanc, gris, marron, avec un léger fond flou de la couleur de l’arrière-plan pour assurer la lisibilité de la typographie. Les adaptations graphiques se déclinent de manière multiple : en insérant les majuscules aux mêmes emplacements, en conservant une typographie toujours sans sérif, dans l’objectif d’être lisible par une majorité de lecteurs, en l’écrasant selon la taille de l’objet, l’étirant en hauteur, en largeur, ou au contraire en s’échappant du cadre de l’objet en question. Même si l’interface paraît sobre au départ, la réalité augmentée tente d’implanter discrètement le texte traduit directement sur son support d’origine, proposant comme une brève illusion de métamorphose. J’y reviendrai plus en détail dans la partie La traduction d’image par la reconnaissance optique de caractères.

Pilsen1 Pilsen2 Pilsen3

Captures d’écran Google traduction en réalité augmentée, et photographie originale.

La traduction de son, reconnaissance automatique du langage naturel

La reconnaissance vocale du langage et les confusions de l’expression orale

Il était divertissant d’écouter ma colocataire iranienne au téléphone toute la journée à Plzeň, comme une douce sonorité décrite par Roland Barthes dans L’Empire des signes11. « La masse bruissante d’une langue inconnue constitue une protection délicieuse, enveloppe l’étranger d’une pellicule sonore qui arrête à ses oreilles toutes les aliénations de la langue maternelle. » Un jour, je tente l’expérience de la reconnaissance vocale. Analysée à partir d’un enregistrement numérique de voix humaine, pour en retranscrire le contenu sous forme textuelle. Cela ne fonctionne pas très bien. J’entends à la volée du vocabulaire relié à des avions, ou à propos d’un individu qui monte dans une voiture, mais au bout du compte, pas de récit construit. Il est nécessaire que le locuteur parle fort et en continu, comme dans un long discours, et non pas qu’il attende une réponse de son interlocuteur se traduisant par un silence en-dehors du combiné. J’ai tenté à nouveau cette expérience avec le discours de Warren Sack12, créateur des œuvres artistiques Conversation map et Translation map, diffusé sur la Yale University Radio. Le résultat est plus consistant car l’artiste parle sans discontinuer en réponse aux questions de l’interviewer. Toutefois, l’algorithme ne différencie pas quel interlocuteur parle, ne distingue pas le bruit alentour, ce qui confond les paroles et aide peu à la compréhension globale. Ceci est d’autant plus perturbé par l’approximation de la traduction. Lorsqu’il est question de « bateaux » dans cette retranscription du discours, Warren Sack évoque en réalité des " bots ", des « robots » et non pas des " boats ". La reconnaissance vocale destinée à la traduction reste encore peu fonctionnelle. Ceci s’explique en partie parce que l’oral obéit à des règles grammaticales moins strictes, ponctué d’onomatopées et hésitations qui doivent être filtrées. Dans une langue, la plupart des mots peuvent avoir plusieurs sens. Par exemple le mot « baguette » désigne en français autant du pain, qu’un accessoire de chef d’orchestre, ou qu’un ustensile de sorcier. Seul le contexte permet d’identifier le sens le plus probable d’un mot parmi ceux possibles. Toutefois, il est toujours possible de formuler la phrase : « Le sorcier a volé la baguette du chef d’orchestre. » Est-il question de la baguette du chef d’orchestre, de la baguette du sorcier envieux que le chef d’orchestre en possède également une, ou bien d’une baguette de pain fraîchement cuite ? Les homophones, mots d’une même langue ayant la même forme écrite ou orale mais ayant des sens différents, sont alors d’autant plus un défi pour la reconnaissance vocale, sans contexte auquel se fier.

Warren_Sack1 Warren_Sack2

Captures d’écran Google traduction en reconnaissance vocale sur le discours de Warren Sack.

Un groupe d’artistes anonymes qui se sont appelés eux-mêmes Language Removal Services ou Service d’Effacement du Langage, aux États-Unis depuis 2002, ont travaillé en contre-exemple sur ces parasites sonores dans des enregistrements, et non plus sur leur contenu significatif. Au lieu de récupérer le discours d’une personne afin de le retranscrire, ils gomment tout le discours qui était enregistré et ne conservent que les langues qui fourchent, les onomatopées, les reniflements, éternuements, toux, soupirs. Ils priorisent la matérialité et l’opacité à la transparence et à la communication.

Échos à la poésie sonore

Le traitement de cette matière propre à la voix, par le biais de l’enregistrement, évoque la poésie sonore, une pratique d’oralisation d’un texte ou d’un poème. Après la traduction automatique qui transcrit une parole à l’écrit par le biais de la reconnaissance vocale, il est possible d’oraliser le texte traduit par la fonction « écouter ». Et de là, d’écouter la performance orale générée par la traduction et la synthèse vocale. Anne-James Chaton, écrivain et performeur, est une figure de la poésie sonore. Récupérant des échantillons d’énoncés déjà existants, il travaille sur la superposition des voix et collabore généralement avec des musiciens, comédiens ou danseurs dans l’oralisation de ses textes. Dans sa pièce nommée Newspaper, il sélectionne un journal sur le lieu de sa performance à venir, et le lit en public. Ainsi, quand cette pièce est jouée à l’étranger, le journal est écrit dans une langue étrangère. L’écrivain le lit avec approximation, comme il lui semble le plus juste. Parfois, ses lectures créent un sens pour le public étranger malgré sa mauvaise prononciation, tandis que d’autres fois ses erreurs créent un sens très éloigné du propos, ou pas du tout. Sa pièce est jouée en duo avec le guitariste Andy Moor, venant ponctuer sa lecture calme au début puis allant crescendo pour atteindre un volume élevé accentué par l’usage d’un haut-parleur à la fin de la performance. Andy Moor accompagne la voix d’Anne-James Chaton par des accords brefs à la guitare, puis peu à peu par une improvisation de plus en plus complexe et sonore.

Fig.2

Chaton, Anne-James, Newspaper, 2008, avec Moor, Andy.

La traduction d’image, par la reconnaissance optique de caractères

Un environnement saturé de messages potentiellement traduisibles

Une autre fonctionnalité de ces outils de traduction est celle de la réalité augmentée appliquée sur une image ou sur notre environnement. Cette fonctionnalité est offerte par Google traduction notamment depuis 2015, ou par Microsoft translator depuis 2012. Cet usage visuel de la traduction est de plus en plus fréquent, mais c’est dans le contexte que se révèle son utilité. Dans un supermarché, je découvre son aspect curieux, fascinant, voire inquiétant. Car qui ne se méfierait pas de « crêpes de poulet » ou de « grains entiers humains » ? En ce qui concerne les « crêpes de poulet », traduction suggérée par la réalité augmentée du tchèque " cizrnové lívanečky ", la traduction devrait être mot-à-mot « crêpes » et « pois chiches », ainsi « galettes de pois chiches ». L’apparition soudaine du mot « poulet » ne trouve pas d’explication logique, la traduction tchèque de « crêpes de poulet » étant " kuřecí placky ". Toutefois, une explication peut être formulée dans le cas des « grains entiers humains », extraits de la phrase " hladká celozrnná pšeničná mouka prvotřídní ", signifiant « farine de blé complet de première qualité ». « Grains entiers humains » se traduirait comme " lidská celá zrna ", ce qui est proche typographiquement de " hladká celozrnná ". La qualité de l’image a sans doute semé une confusion typographique aux yeux de la réalité augmentée offerte par Google traduction, ce qui explique certains décalages au niveau du sens. Utilisée d’abord de manière fonctionnelle, puis devenue un outil ludique pour appliquer un filtre sur le réel, la traduction en réalité augmentée me donne tout de même beaucoup de réponses, me sort de l’incompréhension dans laquelle je me trouve face à la langue tchèque. Je balaye le monde qui m’entoure, récupère un peu de sa matière et la modèle pour lui donner une forme que mes yeux comprennent.

Les textes les plus courts sont parfois les plus saisissants. Une signalétique peut alors être plus percutante et poétique qu’un long récit. Je pense à ce petit texte, traduit dans un supermarché tchèque : « route pour exprimer. » À l’origine « file d’attente », cet élément du quotidien, habituellement illisible, s’est transformé, magnifié. Au départ très pragmatique, cet extrait de phrase traduit a été ensuite complété d’un « intensifiez-vous individuellement », sur ce fil noir destiné à guider les caddies, le texte d’origine étant « distance de sécurité ». La traduction automatique, figeant en temps réel les signes, dévoile l’éclat de ces caractères tchèques un peu sombres, ôtant la page de garde de ce feuilleté de symboles, ouvre l’entrée à une infinité de possibles.

Google_trad1 Google_trad2

Captures d’écran Google traduction en réalité augmentée.

Cette infinité a été pensée par Jorge Luis Borges 13 dans sa nouvelle « La Bibliothèque de Babel » qu’il publie en espagnol en 1944 dans son recueil Ficciones. L’écrivain y décrit une bibliothèque remplie de tous les livres de l’univers, imaginables, imaginés, passés, présents, futurs. Tout y a déjà été écrit, il suffit au lecteur de trouver le livre qui lui correspond, sur la bonne étagère, dans la bonne salle. Tout y a été résolu, l’informaticien n’écrit plus d’algorithme, il lui suffit d’aller le chercher dans le livre qui contient ce qu’il recherche. Tout a été créé, traduit dans toutes les langues existantes et inexistantes, l’avenir y est déjà écrit, le catalogue de la bibliothèque, les catalogues mensongers, les catalogues qui démontrent la fausseté de ces catalogues. En quelque sorte, toutes les combinaisons de lettres et symboles existent dans tous les ordres possibles, qu’elles soient interprétables ou non interprétables par le lecteur et sa langue. Mais ces combinaisons, même gigantesques, sont limitées par les associations possibles d’un nombre de caractères utilisés pour écrire ces livres. Ainsi, même si cette bibliothèque semble infinie, elle possède une limite. Un tel schéma de bibliothèque pourrait évoquer le modèle de l’univers, et à plus petite échelle, les potentialités exponentielles du web. Jorge Luis Borges décrit également que chaque livre partage le même format, contenant quatre cent dix pages, chaque page quarante lignes, et chaque ligne environ quatre-vingt caractères noirs. Le site internet DiceLog héberge un simulateur qui permet de visualiser ces potentiels livres de la Bibliothèque de Babel.

Fig.3 Fig.3

DiceLog

L’omniprésence de caractères hypothétiquement traduisibles dans notre environnement se perçoit d’autant plus dans l’espace urbain lorsque l’on utilise la reconnaissance optique de caractères, car notre environnement visuel urbain est saturé de textes potentiellement traduisibles. Les supports qui n’attendent qu’à capter notre attention, nous délivrent un message commercial, préventif, informatif. Le photographe Matt Siber, dans son Untitled project, qui saisit des scènes de rue, des intérieurs, des parkings, magasins, stations de métro, autoroutes, gomme toute trace de langage sur ses photographies. Et il transfère à l’identique l’ensemble du texte soustrait de la photo pour l’installer à nouveau sur un panneau blanc en vis-à-vis de l’image, en conservant les typographies. Les deux panneaux, l’un de l’image et l’autre du texte, constituent une seule œuvre : un monde dépourvu de langage, et une carte de son transfert. En se séparant de son contexte du langage, nous prenons conscience de son omniprésence, du moins dans l’espace urbain, alors que nous y portons souvent assez peu attention dans la vie quotidienne. L’architecture, que l’on place en général au premier plan, est placée à un rôle secondaire. Elle semble ici n’être plus que la page où sont plaqués les mots, et sans eux, les bâtiments semblent vides et désolés. Le panneau en vis-à-vis du texte devient un poème visuel, plus présent, plus structuré et plus parlant qu’avant.

Fig.4

Siber, Matt, Untitled project, Chicago (États-Unis), 2002-2010.

Traduire par l’image

L’importance du lieu géographique

Si l’environnement urbain est rempli de contenus traduisibles, c’est le lieu dans lequel on se situe qui participe à un besoin ou non de le traduire. Si je connaissais la fonctionnalité de la traduction automatique par réalité augmentée depuis l’année de son lancement en 2015 par Google, c’est en me retrouvant dans un pays étranger que j’en ai réellement eu l’usage. Cette relation géographique avec la traduction, Loss Pequeño Glazier l’évoque relativement tôt, en 1999, dans son œuvre White Faced Bromeliads on 20 Hectares.

Fig.5 Fig.5

Glazier, Loss Pequeño, White Faced Bromeliads on 20 Hectares, New York (États-Unis), 1999.

Il s’agit d’une œuvre de poésie numérique qui utilise l’interactivité afin de questionner la forme traditionnelle imprimée de la poésie. Le poème en ligne se présente comme un générateur de cartes postales : une image de paysage est affichée avec une phrase brève en guise de légende, puis tout est remplacé par un poème composé de texte. Le lecteur a dix secondes pour le lire puis une nouvelle carte postale s’affiche. Le texte mélange des phrases provenant de différentes langues et offre cinq-cents douze combinaisons de poèmes possibles. L’œuvre de Glazier traite ainsi des thèmes de la langue et de la géographie. La géographie étant conceptuellement fixe alors que le langage est fluide. L’image s’ancre dans le recto de la carte, tandis que le texte se régénère constamment au verso. Ce lien met en évidence une hybridité à laquelle nous sommes confrontés au quotidien : les mélanges de langue, de culture se font, dans des lieux qui restent fixes, qui forment un cadre pour tous ces échanges, toutes ces conversations. De même pour les traducteurs automatiques, ils sont indissociables du lieu géographique dans lequel ils sont utilisés. Un besoin particulier de traduction se fait dans un espace déterminé : dans un pays étranger, chez soi face à un texte étranger. La traduction textuelle proposée est variable, elle peut être renouvelée différemment, sous un autre angle, à chaque nouvelle tentative.

→ Entre traduction interlangagière et traduction intersémiotique : substitut des outils de traduction automatique par l’image

Il est important de préciser que ce besoin de traduction à des instants précis peut également être comblé par d’autres alternatives que les outils de traduction automatique, si l’utilisateur ne possède pas de smartphone ou d’ordinateur, d’accès à internet ou privilégie l’interaction non verbale avec l’interlocuteur. Le linguiste Roman Jakobson 14 distinguait justement trois formes de traduction, en 1963. La « traduction intra-linguale » ou simple reformulation, la « traduction interlinguale » ou traduction proprement dite, et la « traduction intersémiotique » ou transmutation qui excède le langage verbal. L’usage d’images ou de pictogrammes pour se faire comprendre de manière dite « universelle » se situerait sans doute à la croisée entre la traduction interlinguale et la traduction intersémiotique.

À ce propos, Point It : Traveller’s language kit est un petit carnet de poche édité en 2009 par Graf Éditions, regroupant mille trois-cents images et aucun texte, à pointer du doigt en voyage, lorsque l’on ne parvient pas à exprimer un besoin dans une langue étrangère.

Fig.6

Graf Éditions, Point It : Traveller’s language kit, Munich (Allemagne), 2009.

Ce carnet contient plusieurs catégories d’images, concernant l’alimentation, l’hôtel, le transport, l’achat, le loisir et le sport ou l’aide. On y retrouve des images diverses comme des animaux, une table de petit-déjeuner contenant toutes sortes d’aliments, des tables de fruits divers, mais aussi des images de prise électrique, de matériel de camping, de transports, d’évènements sportifs, culturels. Toutes ces images sont des photographies, les petits objets sont photographiés sur une table à la manière d’une nature morte, les plus grands objets comme les télévisions, voitures, et activités sont disposés en grille sur l’espace de la page. Aussi, quelques pages sont blanches pour nous permettre d’y dessiner d’autres signes ou peut-être d’y inscrire de nouveaux mots.

Fig.7

Le Guide du Routard, g’palémo, Paris, 2009.

Édité par Le Guide du Routard en 2009, g’palémo, adopte un système similaire. Ce carnet repose lui sur des pictogrammes plutôt que des photographies, et traite des domaines de la santé, de la sécurité, de l’équipement, de l’hébergement, de la restauration et des transports. Ces systèmes pictographiques permettent de dépanner l’utilisateur en voyage lorsqu’il se trouve sans autre alternative, afin de faciliter la communication non verbale, d’instaurer un échange avec les interlocuteurs. Mais bien sûr, ils ne permettent pas de nuancer des propos, d’exprimer des situations complexes, de communiquer au-delà d’un aspect pratique, fonctionnel. Expérience inévitable lorsque l’on parle peu ou mal une langue étrangère.

Traduire dans l’image

Réalité augmentée et reconnaissance optique de caractères

Les traductions basées sur la réalité augmentée utilisent la reconnaissance de caractères, par le biais d’un système appelé OCR, Optical Character Recognition, ou en français ROC, la « Reconnaissance Optique de Caractère ». Son objectif est de convertir l’image d’un texte en un format texte lisible par l’ordinateur, par la conversion des caractères.

L’OCR comporte toutefois certaines failles. Pour commencer, il fonctionne bien mieux sur les typographies scriptes que sur les écritures manuelles, responsables de nombreuses confusions. Cela s’explique par le fait qu’il procède par balayage optique, et doit reconnaître les caractères d’abord individuellement, puis valider l’identification des mots qui les contiennent. Si l’OCR doit apprendre à distinguer la forme de chaque caractère à des tailles différentes, il doit en plus être capable de la distinguer dans chacun des styles typographiques et dans chaque langue. Cette limitation génère les principales erreurs de l’OCR. L’OCR fait plusieurs types d’erreurs sur la reconnaissance des caractères. Par exemple il peut confondre des caractères morphologiquement proches comme « o » et « 0 », « n » et « h », « s » et « 5 ». Il peut ignorer un caractère, considéré comme un bruit de l’image. Il peut aussi dédoubler un caractère en deux autres car la morphologie de ses formes accolées peut être proche du caractère d’origine comme entre « m » et « rn », « d » et « cl », « w » et « vv ».

Ces failles de l’OCR évoquent alors les erreurs « 404 » décrites par Stuart Moulthrop 15. Ces erreurs apparaissent lorsque nous naviguons sur internet, mais aussi lorsque le distributeur automatique rejette notre carte ou que le code-barre ne passe pas à la caisse, ou encore lorsque la traduction automatique est indisponible. Stuart Moulthrop note que de telles situations ne sont pas simplement source d’irritations mais plutôt des lueurs de révélation, éclairant potentiellement quelque chose d’important à propos de notre société. Ces erreurs seraient comme de minuscules brèches qui perforent cette illusion que le monde humain reste inchangé même avec des « machines intelligentes » à nos côtés. Le code informatique, le système symbolique qui communique entre les humains et les machines intelligentes, fonctionne à double tranchant. D’une part, le code est essentiel pour partager un message clair avec la société, d’autre part, le code produit comme une mutation du langage qui échappe peu à peu au contrôle de ses utilisateurs.

Mais cette incompréhension latente, source d’approximation et d’erreur, permet de belles découvertes allant au-delà de la limite fixée par des concepteurs. L’OCR a pour ambition, combiné aux outils de traduction automatique, de reconnaître un texte d’origine à traduire vers une langue cible à grande vitesse. Et même quand il n’y a en apparence rien à traduire l’OCR tente tout de même de faire son travail, au point de générer un texte fantôme. Lorsque l’OCR est appliqué à un paysage urbain sans texte aux alentours, il détecte dans les fenêtres lointaines des bâtiments comme de petits éléments alphanumériques potentiellement traduisibles. En essayant de scanner le monde, mais tout à coup sans aucune annonce publicitaire, sans signalisation, sans texte s’offrant au besoin d’être traduit, des lettres peuvent alors se découper de ces fenêtres, produisant des onomatopées comme « lltiti ! », « iiitit ! », ou même formulant des mots de substantifs comme « auberge » ou « litre ».

ocr ocr

Capture d’écran d’une des failles dans l’OCR de Google traduction, et photographie originale.

Figer une traduction : entre traductions obsolètes et traductions potentielles

Ces traductions réalisées à partir de la réalité augmentée et de l’OCR, il est possible de les conserver par des captures d’écran après avoir stoppé la traduction, c’est-à-dire après avoir appuyé sur le bouton « mettre en pause la traduction ». Cette fonctionnalité paraît anodine mais interroge la fixation d’un texte en constant changement, en constant renouvellement, qui tente de traduire sans arrêt tout contenu éventuel. Nous sommes confrontés très fréquemment à ce phénomène de renouvellement numérique : les langages de programmation évoluent, la page du journal d’actualité en ligne change constamment, la mise à jour se fait dynamiquement, les dernières alertes sont très vites dépassées par d’autres. L’espace numérique y est comme une constellation, surgissant comme un flash de lumière, susceptible de disparaître aussi vite à chaque rafraîchissement de la page. Ce constant renouvellement est proche de ce que Walter Benjamin 16 nommait une « image dialectique », un lieu où la fusion momentanée du passé et du présent crée une image. Pour lui, « le lieu où l’on rencontre l’image dialectique est le langage ». Cette image dialectique, serait-elle représentative de cette capture d’écran Google traduction, dont la traduction affichée se situe à la rencontre entre traductions obsolètes et traductions potentielles, de la fixation en image de ce texte en perpétuel changement ?

Auteur et chercheur, Jean-Pierre Balpe fait partie du groupe d’écrivains formant l’A.L.A.M.O. (Atelier de Littérature Assistée par les Mathématiques et les ordinateurs). Il expliquait dans « Pour une littérature informatique : un manifeste » 17, en avril 1994, que derrière un texte généré numériquement se lisent tous les autres textes possibles, c’est-à-dire d’autres textes potentiels. Le texte affiché n’est alors que la concrétisation particulière d’une infinité de possibles. Le texte informatique crée une forme nouvelle, sans début ni fin, comme la parole il se déroule selon son propre mouvement, il s’anime, se déplace sous nos yeux, se fait et se défait, c’est un « texte panoramique ». Jean-Pierre Balpe a réalisé des générateurs de textes à vocation littéraire. Il indique que ce qui est donné à lire est à la fois un texte et son mode d’emploi, son principe de génération ne peut pas être détaché du résultat. Un générateur de texte laissera toujours apparaître les traces de sa production sur le texte produit.

Cet aspect mutable du processus de traduction est évoqué dans l’œuvre de John Cayley, Translation.

Fig.8

Cayley, John. Translation, Canada, 2004.

Il s’agit d’une œuvre de poésie numérique accompagnée d’une musique générative de Giles Perring, datant de 2004, auparavant disponible sur ce lien avant que son encodage ne soit plus lisible par les technologies d’aujourd’hui. On y apercevait un écran noir progressivement remplacé par des fragments d’images de pages imprimées contenant justement des passages de l’essai de Walter Benjamin, On Language as Such and on the Language of Man. Ces passages étaient soumis à un processus de traduction en continu, affichant la traduction en anglais, en français, en allemand, chaque langue étant disposée l’une en-dessous de l’autre. Le processus de traduction n’était jamais terminé, jamais figé, en fonction des passages du texte affichés par l’ordinateur. Ces traductions n’étaient parfois même pas compréhensibles en tant que telles, elles se transformaient ainsi en successions de lettres dépourvues de sens.

Langage naturel & langage informatique

Révéler le code « dissimulé » au monde : les outils de traduction automatique en open source

Une particularité de ces outils de traduction automatique est que leur code source n’est pas entièrement accessible, visible, le code de ces outils est en quelque sorte caché au monde, et s’il était récupéré d’une manière détournée, il ne serait compréhensible que pour une minorité de personnes. Les logiciels de traduction automatique décrits précédemment sont des logiciels propriétaires, compilés en un programme exécutable, ce qui explique que leur code source ne soit pas accessible. C’est un choix d’ordre économique et par cela politique. Vilém Flusser, dans La civilisation des médias 18, expose certaines problématiques que cette inaccessibilité au code source et à sa compréhension par la majorité des individus engendre.

« Les nouveaux codes informatiques sont " idéographiques ", ils ont rompu le lien entre la pensée et la parole. La nouvelle élite pense en nombres, en formes, en couleurs, en sons et toujours moins en mots. Une élite dont la tendance à l’hermétisme ne cesse de s’accentuer développe des modèles de connaissance, d’expérience vécue et de comportement, à l’aide d’intelligences artificielles qu’elle programme elle-même, et la société se règle sur ces modèles qu’elle peut suivre, mais non déchiffrer. Comme ces modèles lui sont opaques (des boites noires), elle n’a même pas complètement conscience d’être ainsi manipulée. Parler les langues et les coder en lettres est en train de devenir superflu. »

La position de Flusser était radicale, envisageant un futur sans langage naturel, une prédominance des langages informatiques, nous enfermant dans ces boîtes noires de moins en moins déchiffrables. Mais il explique par là même la nécessité nouvelle pour toujours davantage d’informaticiens et programmateurs de partager leurs travaux en open source, incitant l’utilisateur à s’approprier les logiciels dont il fait usage, sur un modèle plus ouvert.

Une telle option s’offrirait actuellement à nous en faisant usage de logiciels de traduction automatique en open source afin d’en comprendre les mécanismes. J’ai testé deux de ces logiciels. Apertium est l’un de ces logiciels de traduction automatique accessibles en open source, ses composants sont disponibles sur la plateforme GitHub.

Apertium

Apertium, traduction espagnol-français.

Ce logiciel a été développé par le groupe Transducens du département de langages et systèmes informatiques de l’université d’Alicante. Il s’adresse alors prioritairement aux hispanophones, privilégiant les liaisons de langues avec l’espagnol, et en délaissant d’autres comme la liaison anglais-français. Un texte français peut uniquement être traduit en espagnol, en catalan, en esperanto, en occitan ou en franco-provençal, des langues majoritairement régionales. Un texte en slovène, lui, peut être traduit en bosniaque, en serbe ou en croate uniquement, toujours dans le cercle de sa famille linguistique. C’est un logiciel de traduction qui ne s’adresse ainsi qu’à une minorité d’usagers, et qui appelle ses utilisateurs à le perfectionner par un travail collaboratif. La traduction d’une phrase espagnole en français donne un résultat peu convaincant, le texte original inséré étant : " En vacaciones, el fin de semana o después del trabajo tienes tiempo libre para hacer ejercicio, llevar un pasatiempo o salir a divertirte. " et la phrase traduite : « En des vacances, le week-end ou après le travail, tu as temps libre pour faire exercice, porter un pasatiempo ou sortir à te amuser. »

MateCat

MateCat, traduction espagnol-français.

MateCat, lui, est un logiciel en open source plus fonctionnel. Il ressemble à un outil de traduction automatique comme Google traduction, mais inclue un dictionnaire comme Linguee, proposant des alternatives de traductions en-dessous de la suggestion principale, des propositions dont la correspondance est plus faible. Cette interface propose en priorité les résultats de la traduction dite « machine », MT ou Machine Translation, et en second lieu les traductions qui ont été recherchées en externe dans Public corpora, un corpus accessible en open source. La traduction de la même phrase espagnole en français propose alors une traduction plus convaincante : « En vacances, le week-end ou après le travail, vous avez du temps libre pour faire de l’exercice, pratiquer un passe-temps ou sortir pour vous amuser. »

Ces deux logiciels de traduction automatique en open source ont une éthique de partage de leurs ressources, toutefois ils ne peuvent pas encore rivaliser avec les géants de la traduction automatique comme Google ou DeepL à cause du peu de langues traduisibles, ce qui se résoudra sans doute en leur accordant plus de temps pour augmenter leurs capacités. Leur atout réside dans l’aspect collaboratif de leur confection, ce qui permet d’augmenter et d’améliorer ces outils, d’exploiter librement leurs composants.

Apertium

Apertium, liste des langues disponibles.

Quand le code « comprend » (mal) le langage : contexte, analyse sémantique, erreurs

Lors d’une mauvaise traduction, deux mots qui contrastent étrangement entre eux sonnent comme un faux accord, mais permettent de révéler des caractéristiques de la langue. Une mauvaise traduction peut être accentuée encore avec la correction automatique, ou frappe prédictive, qui favorise ces confusions d’ordre linguistique. Cette fonctionnalité, présente dans une majorité de logiciels, permet de suggérer à l’utilisateur la suite de la phrase qu’il est en train de saisir numériquement. C’est de cette manière qu’une étudiante taïwanaise a eu la surprise de recevoir une question d’une italienne lui demandant " How is the weather in your kitchen ? ", « Quel est le temps dans ta cuisine ? » complété d’un « Dans la mienne, c’est jaune-marron. » En réalité, l’italienne lui demandait " How is the water in your kitchen ? ", « Comment est l’eau dans ta cuisine ? ». Mais la correction automatique a calculé une probabilité plus grande pour que la question porte sur le temps, posée fréquemment, et non sur la qualité de l’eau. Ces erreurs proviennent du fait que notre langue est remplie d’ambiguïtés, ce qui est souvent résolu par la contextualisation du propos. Proposer à ces outils une phrase à traduire, sans contexte, est propice aux incompréhensions. Car pour obtenir un bon niveau d’interprétation, il faut généralement une connaissance du monde. Ces outils de traduction automatique n’en disposent que sur un plan artificiel, celui des corpus.

La correction automatique est permise par le Traitement Automatique du Langage Naturel qui procède par analyse sémantique grâce à des algorithmes. L’analyse sémantique étant la branche du traitement automatique des langues qui vise à « comprendre » le sens d’un texte. L’un des algorithmes mis en place dans cette branche calcule la distance de Levenshtein, c’est-à-dire la distance mathématique entre deux chaînes de caractères. Il compte le nombre minimum d’opérations nécessaires pour transformer une chaîne de caractères en une autre, ces opérations pouvant être de l’ordre de l’insertion d’un nouveau caractère, de la suppression d’une lettre, ou de la substitution d’une lettre par une autre. Lorsqu’un mot dans un texte est inconnu du lexique du correcteur automatique, il est comparé aux mots qui lui ressemblent le plus, donc aux plus proches au sens de la distance de Levenshtein. Le correcteur choisit le mot ayant la plus courte distance avec le mot à corriger. Depuis 2013, le domaine de l’analyse sémantique a connu une grande évolution par les premiers modèles de représentation vectorielle de mots, en particulier par l’algorithme word2vec. Selon les ingénieurs en informatique et docteurs en linguistique et physique théorique François-Régis Chaumartin et Pirmin Lemberger 19, il permet de reconstruire le contexte linguistique des mots non plus en fonction de leur graphie, mais en fonction de leur sens. Cette approche sémantique suppose alors qu’un mot est défini par les mots qui l’entourent. L’algorithme word2vec opère par calculs de word embedding, c’est-à-dire de « plongement lexical ». Il transforme des mots en vecteurs, en s’entraînant sur un corpus de grande taille, et les place aux côtés des mots qui leur ressemble dans un espace fictif. Un mot peut exister dans plusieurs cercles de mots, s’il est employé dans plusieurs contextes. Cette nouvelle approche permet alors de prédire le sens d’un mot qui n’aurait jamais été rencontré avant, au lieu de le remplacer par un mot qui lui ressemble graphiquement mais qui n’a aucune relation sémantique avec le nouveau mot. Dans le cas d’une traduction entre deux langues, les avancées dans le domaine de l’analyse sémantique sont remarquables. Les algorithmes de traitement automatique des langues cherchent à « comprendre » sinon à situer le contexte dont il est question, et réduisent les écarts provoqués par la correction automatique. La mise en place du word embedding apporte beaucoup au domaine, mais reste toutefois limité à la mise en relation de mots et non pas à une correspondance sémantique précise entre deux phrases traduites dans leur ensemble. Même si les outils de traduction automatique permettent d’échanger plus facilement entre deux langues, ils ne permettent toujours pas d’éviter certaines confusions linguistiques. Ils les favorisent parfois au contraire car s’ils méconnaissent la langue source ou cible, il leur est difficile de filtrer les erreurs.

Certains artistes ont travaillé sur cette proximité entre deux termes similaires, mais qui sont très éloignés au niveau du sens, comme John Cayley dans son travail Deferred lest meaning hoard solidity, en 2019.

Fig.9

Cayley, John. Deferred lest meaning hoard solidity, Canada, 2019.

Il part du constat que dans certaines polices, les lettres semblables visuellement se distinguent par l’ajout ou le retrait d’un seul élément, et que certaines paires de mots contenant ces lettres dans la même position se distinguent de façon minimale. John Cayley joue ainsi typographiquement avec les paires f/t et e/o dans une composition affichant des mots en série, et dont les paires de lettres énoncées se superposent. Visuellement, le résultat joue alors avec la perception incertaine du lecteur. Ainsi, la phrase " deferred lest meaning heard solidify ", « différé de peur que le sens entendu ne se solidifie », peut autant être lue comme " decerred lest moaning hoard solidity ", « décédé de peur de gémir la solidité du trésor », que " deferred lost meaning heard solidity ", « reporté perdu sens entendu solidité ». Le texte peut sembler fixe car il ne se regénère pas par un système numérique, mais selon le regard qu’on lui porte, il énonce toujours quelque chose de différent.

Convertir des données du langage naturel en langage informatique

Selon Vilém Flusser 20, le terme grec poiesis, ayant créé le mot français « poésie », exprime la création de quelque chose de neuf. Ce qui indiquerait que la poésie n’est pas reliée à l’acte de parole, et que les activités informatiques peuvent tout à fait être définies comme poétiques. Alors, « la poésie ne doit pas être localisée dans les seuls textes appelés poétiques, elle est présente dans la littérature tout entière. »

Kenneth Goldsmith est un poète, fondateur de la bibliothèque numérique UbuWeb en 1996, et qui a donné à l’université de Pennsylvanie des cours « d’écriture sans écriture » 21, ou d’uncreative writing en opposition aux cours de creative writing dispensés dans une grande partie des universités américaines. Dans ses cours, les étudiants sont pénalisés s’ils s’autorisent dans leur travail la moindre trace d’originalité et de créativité, et sont gratifiés pour leurs plagiats, vols d’identité, recontextualisations d’articles, échantillonnages, pillages. La mission paradoxale donnée à ses étudiants est alors de récupérer toutes sortes de données du langage naturel, venant de tous les horizons possibles. Puis, de cette matière formée de données, y ajouter de la valeur, ou la garder telle qu’elle était déjà transformée.

L’artiste Eric Zboya a suivi cet exemple en récupérant ces données du langage, qu’il a traitées visuellement dans son projet Algorithmic translation, consistant en une série d’images générées automatiquement.

Fig.10

Zboya, Eric, Algorithmic translation, Canada, 2016.

À partir des logiciels de traduction automatique, notamment Google traduction, il utilise la fonctionnalité mathématique de logiciels d’imagerie graphique pour réaliser des visualisations de traductions. Grâce à une série de calculs, le programme informatique qu’il utilise produit une image abstraite qui repose en partie sur les emplacements topographiques des phrases dans l’espace de la page web. Cet algorithme artisanal extrude chaque lettre, chaque marque de ponctuation, formant comme une arborescence sur la surface de la page. Le poète tente ainsi de visualiser graphiquement un texte, à partir d’un logiciel de traduction automatique, jouant avec l’espace d’interprétation graphique qu’offrent ces outils de traduction.

Fig.11

Beaulieu, Derek, Flatland, Canada, 2002.

Derek Beaulieu récupère dans cette même lignée les données littéraires du livre Flatland, en 2002. Il supprime toutes les lettres du livre d’Edwin Abbott, créant une œuvre de littérature sans mot, une manière d’écrire sans lettres. Ensuite, à chaque page, ligne après l’autre, il créé une série de lignes enchevêtrées, représentant chaque emplacement des lettres dans le texte d’Abbott, de la première page à la dernière. Il commence par la première lettre de chaque page, trace une ligne vers l’occurrence suivante de la même lettre sur cette page, puis la suivante et ainsi de suite, jusqu’à atteindre la fin. Il prend ensuite la seconde lettre du premier mot de la page et procède de la même manière. Il le fait jusqu’à ce que toutes les lettres de l’alphabet présentes sur la page aient été reliées. Ce principe utilise alors une donnée littéraire préexistante afin de former une œuvre graphique visuelle et conceptuelle.

Fig.12 Fig.12

Raw Color, Cryptographe, Eindhoven (Pays-Bas), 2012.

Dans une autre approche quelque peu différente, le projet du Cryptographe créé par le studio Raw color propose à l’utilisateur d’insérer lui-même ses données de langage verbal dans une interface numérique. La cryptographie est le domaine qui a ouvert aux premières expérimentations de la traduction automatique. Le projet porté sur un traitement algorithmique du langage naturel, permet de traiter graphiquement des textes numériques. Le studio a créé une machine numérique similaire à un métier à tisser qui génère des bandes de tissu recouvertes de motifs dont les formes dépendent d’un texte numérique que l’on insère dans l’interface. Pour générer le tracé d’un tissu, l’utilisateur insère ainsi un message dans la machine, puis chaque caractère est traduit en un motif spécifique avant d’être imprimé en une succession de ces motifs. La taille et l’échelle du motif sont déterminés par la quantité de mots envoyés à l’impression. Les icônes ont été pensées en fonction de la fréquence d’apparition des lettres en anglais, certains glyphes utilisés fréquemment sont déclinés en différents motifs pour que la composition graphique finale soit plus équilibrée, plus harmonieuse.

Convertir des données du langage informatique en données du langage naturel

À la question « le code est-il une langue ? » que pose Scott Rosenberg à Ellen Ullman dans un entretien 22, celle-ci répond :

« Nous pouvons nous servir de l’anglais pour faire de la poésie, pour tenter d’exprimer des choses qui sont extrêmement difficiles à exprimer. C’est impossible en programmation. Au bout du compte, un programme informatique n’a qu’un seul sens : ce qu’il fait. Il ne s’agit pas d’un texte à l’intention d’un universitaire. Son sens dérive intégralement de sa fonction. »

En insistant sur le fait que le code ne permet aucune erreur, Ellen Ullman souligne sa fonctionnalité. Cette fonctionnalité du code, obéissant à des normes très rigoureuses, permet toutefois de rappeler qu’à l’origine, les écritures étaient avant tout utilisées dans la gestion de comptes, dans le dressage de listes, comme le note Jack Goody dans La Raison graphique 23 en 1979. L’écriture littéraire, entre autres, n’est venue que plus tard. Le code, à priori destiné à un but uniquement fonctionnel, pourrait-il alors se destiner à des usages plus littéraires ?

Une forme de réponse se trouve dans la pratique du code work ou « travail de code ». Ce terme désigne une pratique linguistique dans laquelle l’anglais, ou une autre langue naturelle, est entremêlé avec des expressions de programmation pour créer un style hybride faisant parfois sens pour les lecteurs humains, en particulier les plus familiers avec les termes utilisés dans les langages de programmation. Le travail de code dans sa forme la plus pure est lisible et exécutable par une machine, comme les Perl poems, ou poèmes Perl, qui ont deux destinataires à leur écriture, les humains et les machines informatiques. D’autres poèmes Perl utilisent du broken code, un code qui ne peut pas être réellement exécuté mais qui utilise la structure grammaticale de la programmation à la manière de signifiants linguistiques. Un exemple de poème au broken code est celui d’Angie Winterbottom, qui a gagné avec son écrit la Perl poetry contest en 2000, compétition organisée en ligne par l’informaticien américain Kevin Meltzer.

Fig.13

Le texte d’origine de Jim Steinman, pour son album The Invocation sorti en 1989, étant :

If light were dark and dark were light The moon a black hole in the blaze of night A raven’s wing as bright as tin Then you, my love, would be darker than sin.

Même si la programmation de ces outils de traduction automatique est opaque pour les utilisateurs, cela ouvre tout de même à la créativité de ceux qui en maîtrisent les codes.

Un développeur, Dylan Beattie 24, répond lui aussi indirectement à Ellen Ullman en affirmant que le code peut être destiné à un universitaire, ou plutôt, à un amateur de rock. Il a développé un langage informatique nommé le " Rockstar " qui permet d’écrire des paroles de heavy metal tout en codant réellement un programme exécutable. Son idée provient du fait que beaucoup d’offres d’emploi dans le domaine informatique décrivent être à la recherche d’un « développeur rockstar » dans le sens expert de la programmation. Lassé de ces annonces, il s’est demandé ce qu’il se passerait si tout le monde pouvait devenir un développeur rockstar en un instant. Son site permet de s’essayer à la conversion d’un code dans un langage informatique quelconque en langage Rockstar. Pour procéder à la création de son langage, Dylan Beattie a instauré quelques règles simples permettant de transformer des symboles mathématiques en signes linguistiques. Ainsi, le symbole « = » est traduit par le terme " is ", « > » devient is " stronger than ", « 3 » devient " ice ", « 100 » devient " the limit ", etc. Ce qui permet d’obtenir des paroles façon Rockstar comme " midnight takes your heart and your soul " pour « l’opérateur modulo prend un nombre et un diviseur ». Cette expérimentation de traduction d’un langage informatique en langage naturel est ainsi créative et ouverte à modification, puisque l’auteur met à disposition le code source de son langage sur la plateforme de partage GitHub.

Ces conversions entre langage informatique et langage naturel ouvrent la porte à de fascinantes créations interdisciplinaires, où le terme de traduction automatique serait davantage associé à l’idée d’une conversion instantanée entre deux langages, qu’ils soient informatiques, naturels, et ainsi qu’ils soient de nature fonctionnelle, mathématique, langue vivante, morte, fictive, imaginaire, plutôt qu’à la conversion instantanée entre deux langages naturels au sens strict du terme.

Conclusion

Salman Ruschdie, dans son récit Imaginary Homelands25 en 1992, souligne que le mot « traduction » remonte étymologiquement au mot latin « transporter ». Ayant été portés à travers le monde, nous serions des êtres traduits. Nous supposons habituellement que nous perdons toujours quelque chose dans la traduction : il faudrait s’en tenir à l’idée que quelque chose peut également y être gagné. Ces considérations portées le long de ces pages à propos de ces outils de traduction automatique desquels nous pouvons disposer au quotidien et à propos de leur traitement du langage, ont ainsi mêlé sociologie, linguistique, informatique, design graphique, en parts plus ou moins fines, plus ou moins importantes. Elles ont soulevé des questionnements d’ordre structurels, graphiques, théoriques, et révélé quelques potentialités créatives, par leur qualité de génération automatique plus ou moins maîtrisées d’un texte, d’un son, d’une image.

Lorsque nous observons attentivement ces outils de traduction automatique, il est évident que le contexte d’utilisation détermine leurs paramètres d’usage et leurs performances. Les employer lors d’un voyage permettra d’apprécier leur caractère instantané, comme de petits poissons Babel artificiels venant augmenter nos yeux et nos oreilles. La qualité de la traduction reste variable, toutefois avoir ces outils toujours en poche permettra de surpasser quelques difficultés interlangagières, de communiquer, de manière plus ou moins maladroite, plus ou moins juste, à l’étranger. Au contraire, les employer sur la totalité d’un ouvrage dans une langue étrangère ou sur une grande quantité de texte dans un intérêt professionnel, révèlera plus de frustrations que de bonheurs. À moins que la langue à traiter soit écrite avec un vocabulaire contraint, évoquant le champ de la programmation. Ces outils seront alors appréciés, ou dépréciés, selon les attentes que nous plaçons en eux. Mais s’il nous arrive de ne pas saisir les mécanismes sous-jacents à ces outils de traduction automatique, la réciproque est vraie, lorsqu’ils tentent de nous « comprendre ». « Parler humain » est loin d’être simple, il suffit pour s’en convaincre d’apprendre une langue étrangère, de se confronter à ses structures de pensée qui nous échappent et qui sont déterminées par des constructions différentes de la langue. Il suffit de se retrouver face à une culture qui ne nous est pas familière, dont on ne connaît pas les coutumes, les repères, les subtilités du langage. Il suffit d’expérimenter nous aussi, cette méconnaissance du monde. Il est nécessaire de faire le deuil de la traduction parfaite, qui est révélée d’autant plus par l’usage de ces outils de traduction automatique. Malgré les avancées dans le milieu du traitement automatique du langage, la qualité et la pertinence d’une traduction seront toujours imparfaits et discutables. Les spécialistes s’accorderont sur le constat que le domaine de la traduction est inépuisable en délibérations.

Mais ces failles ouvertes par ces outils et à l’intérieur même de ces outils de traduction automatique, peuvent être perçues comme un espace latent de création, d’imagination, à propos du langage, un espace « entre », où tout est envisageable. La traduction qui peut tenter de naturaliser un texte dans une langue d’adoption, ou de prendre quelques libertés avec le message d’origine, peut également être une (re)création. Les outils de traduction automatique, pensés comme un espace de conversion entre deux langages, quels qu’ils soient, offrent un espace de jeu formidable pour nous transporter d’un langage à un autre, d’une réalité à un imaginaire, d’une pensée à sa matérialisation.

Pierre Lévy 26 suggère que « nous avons besoin d’un œil critique et d’un œil visionnaire pour discerner de nouveaux problèmes et envisager les avenirs dissimulés », après avoir décortiqué ces outils de traduction automatique et considéré une infime partie de ce qu’ils impliquent, de leurs atouts, de leurs défauts, de leur passé et de leur présent, peut intervenir la projection future. Des perspectives ont déjà été ouvertes et amorcées aujourd’hui par l’automatisation du traitement du langage, des projets mêlent déjà de manière multidisciplinaire design graphique, informatique, linguistique, mathématiques, il est désormais temps d’aller à leur rencontre, d’aller explorer ces univers en expansion. Et, si nous nous déplacions de disciplines en disciplines, que nous choisissions de nous intéresser à l’un de ces univers en particulier, qu’en est-il aujourd’hui des applications de la traduction automatique, de l’automatisation du traitement du langage, sur les domaines du cinéma, du théâtre, ou bien de la musique, où paroles, écrits et sonorités sont riches en interprétations, riches en régénérations ? Julien Pichavant, dans son livre La perte de sens 27, dit très bien par ailleurs que « deux mots qui se suivent et qui forment une paire-entité harmonieuse, sont à la pensée, ce que deux notes qui se suivent et qui forment ainsi une liaison réjouissante aux oreilles, sont à la musique. » À nous désormais d’orienter nos sens dans l’une de ces directions, et d’y explorer dissonances et consonances.

Notes


  1. Page Wikipédia « Tchèque ». 

  2. Barthes, Roland. L’aventure sémiologique, Seuil, Paris, 1985. 

  3. Berman, Antoine, L'âge de la traduction : « la tâche du traducteur » de Walter Benjamin, un commentaire, Presses universitaires de Vincennes, Paris, 2008. 

  4. Raley, Rita. « Machine Translation and Global English », The Yale Journal of Criticism 16 n°2, Baltimore (États-Unis), 2003. 

  5. Boroditsky, Lera. " How does our language shape the way we think ? ", revue en ligne Edge, 2011. 

  6. Thomas Lebarbé, invité par l’ESAD de Valence, est intervenu en ligne lors d’un séminaire le 17 novembre puis le 15 décembre 2020 pour échanger avec les étudiants. 

  7. Ricœur, Paul. Sur la traduction, Bayard, Montrouge, 2003. 

  8. Ivanov, Vjačeslav & Metner, Emilij, « Correspondances depuis deux mondes », Voprosy literatury n°3, pp. 307-317, Moscou (Russie), 1994. 

  9. Lushenkova Foscolo, Anna & Smorag-Goldberg, Malgorzata. Plurilinguisme et auto-traduction – Langue perdue, langue « sauvée », Eur’Orbem Éditions, Paris, 2019. 

  10. Cliquet, Etienne. « Esthétique par défaut », revue en ligne Teleferique, 2002. 

  11. Barthes, Roland. L’Empire des signes, Albert Skira, Genève (Suisse), 1970. 

  12. Carey, Brainard. " Warren Sack, Interviews from Yale University Radio WYBCX ", New Haven (États-Unis), 2016. 

  13. Borges, Jorge Luis. Fictions, « La Bibliothèque de Babel », Gallimard, Paris, 1951. 

  14. Jakobson, Roman. " On linguistic aspects of translation " paru dans l'ouvrage On Translation de Brower, Reuben, Oxford University Press, Oxford (Royaume-Uni), 1959. 

  15. Moulthrop, Stuart. " Error 404 : doubting the web in Metaphor, Magic, and Power ", Routledge, Londres (Royaume-Uni), 2000. 

  16. Benjamin, Walter. Images de pensée, « Fouilles et souvenirs », Christian Bourgeois, Paris, 1998. 

  17. Balpe, Jean-Pierre. « Pour une littérature informatique : un manifeste… », revue Action poétique, Université Paris VIII, Paris, 1994. 

  18. Flusser, Vilém. La civilisation des médias, Circé, Belval, 2006 (pp. 40-41).  

  19. Chaumartin, François-Régis & Lemberger, Pirmin. Le traitement automatique des langues – Comprendre les textes grâce à l’intelligence artificielle, Dunod, Paris, 2020.  

  20. Flusser, Vilém. La civilisation des médias, Circé, Belval, 2006. 

  21. Goldsmith, Kenneth. L’Écriture sans écriture : du langage à l’âge numérique, Jean Boîte Éditions, Paris, 2018. 

  22. Rosenberg, Scott. Interview de la développeuse Ellen Ullman, " Elegance and Entropy ", revue Salon, 1997. 

  23. Goody, Jack. La Raison graphique : la domestication de la pensée sauvage, Les éditions de Minuit, Paris, 1979. 

  24. Conférence NDC (Norwegian Developers Conference) à destination des développeurs, " The art of code " par Dylan Beattie, Londres, 2020. 

  25. Ruschdie, Salman. Imaginary Homelands : Essays and Criticism 1981-1991, Granta Books, Cambridge (Royaume-Uni), 1992. 

  26. Préface de Pierre Lévy pour L’être et l’écran : comment le numérique change la perception, de Stéphane Vial, « Critique et visionnaire : le double regard des sciences humaines », Presses universitaires de France, Paris, 2013. 

  27. Pichavant, Julien. La perte de sens, Librinova, Paris, 2015.